昆虫 学 报 4cta Entomologica Sinica, May 2011, 54(5) : 555 -565 ISSN 0454-6296 


X 25 WR ER 2x du Us E [A] ZE = Fe: 21| l| XE # 27 AT 


X G.S BU, KE, AHR, AZE 


(1. 安徽 师范 大 学 生命 科学 学 院 , 安徽 芜湖 241000; 2. 中 国 科 学 院 动物 研究 所 动物 进化 与 系统 学 重点 实验 室 , 北京 100101) 





摘要 : 目前 有 关 蝶 类 线粒体 基因 组 全 序列 及 其 分 子 进化 的 研究 报道 还 不 多 见 。 本 文 利 用 long PCR 和 引物 步 移 法 得 
BK BB PRES Calinaga davidis 的 线粒体 基因 组 全 序列 , 同时 就 其 基因 组 成 和 结构 特点 作 了 初步 分 析 。 结 果 显 示 : 其 
基因 组 全 长 为 15 267 bp (GenBank 登录 号 为 HQ658143)，, 包括 13 个 蛋白 质 编码 基因 ( ATP6, ATP8, COI - III, NDI - 
6, ND4L, Cytb)、22 个 tRNA 基因 、2 个 rRNA 基因 (16S 和 12S) 以 及 非 编码 的 控制 区 。 与 其 他 鲜 翅 目 昆虫 相 一 致 ， 
其 基因 组 未 出 现 基因 重 排 现 象 。 基 因 组 共 包 含 11 个 基因 间隔 区 , 总 长 度 为 130 bp, 间 陋 长度 1 ~46 bp, 最 大 间隔 在 
tRNA" 5 ND2 基因 之 间 ; 基因 间 共 存在 13 karan, 总 长 度 为 66 bp, 重 春 碱 基数 1 ~35 bp, 最 长 的 重 春 区 位 于 COM 
与 tRNA Ao rRNA 和 srRNA 基因 长 度 分 别 为 1337 bp 和 773 bp; K tRNA? C69 kl» TARREI (DHU stem), 
在 相应 的 位 置 上 只 形成 一 个 简单 环 外 , 其 余 的 tRNA 基因 都 能 形成 典型 的 三 叶 草 结构 。13 个 蛋 日 编码 基因 总 长 度 为 
11 247 bp, 共有 3 737 个 密码 子 , 它们 的 碱 基 组 成 和 密码 子 的 使 用 具有 明显 的 偏 倚 性 ; 除 COT 外 (起 始 密码 子 TTG) , 
其 余 的 12 个 蛋白 质 编码 基因 都 以 标准 的 ATN 作为 起 始 密码 子 ; COI 基因 终止 密码 子 为 不 完全 T, NDA 基因 终止 密码 
子 为 不 完全 TA, 其 余 基因 都 以 TAA 为 终止 密码 子 。A +T 丰富 区 全 长 为 389 bp, A+T 含 量 高 达 92.0% , 其 中 存在 2 
段 类 似 微 卫星 的 重复 序列 (TA)。 和 (AAT),。 本 文 的 研究 结果 为 探讨 绢 峡 蝶 亚 科 在 峡 蝶 科 中 的 系统 学 地 位 及 其 与 其 
他 亚 科 间 的 系统 发 生 关 系 等 问题 提供 了 重要 的 分 子 生物 学 数据 。 
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Sequencing and analysis of the complete mitochondrial genome of Calinaga 
davidis Oberthiir ( Lepidoptera: Nymphalidae) 

XIA Jing , HU Jing’*, ZHU Guo-Ping , ZHU Chao-Dong^" , HAO Jia-Sheng"* (1. College of Life 
Sciences, Anhui Normal University, Wuhu, Anhui 241000, China; 2. Key Laboratory of Zoological 
Systematics and Evolution, Institute of Zoology, Chinese Academy of Sciences, Beijing 100101, China) 
Abstract: Up to now, the reports about the complete mitochondrial genome of butterflies and their 
corresponding molecular evolutions are still limited. In this paper, the complete mitochondrial genome 
(mitogenome) of Calinaga davidis was sequenced and analyzed using the long PCR and the conserved 
primer walking technology. The results showed that the entire mitochondrial genome sequence was 15 267 
bp long (GenBank accession no. HQ658143) , containing 13 protein-coding genes ( ATP6, ATP8, COI - 
III, ND1 -6, ND4L and Cytb) , 22 transfer RNA genes, 2 ribosomal RNA genes (IrRNA and srRNA) and 
a putative control region ( D-loop). All the 37 genes are arranged in the same orientations as those of other 
lepidopteran species determined ; and there are 11 intergenic spacer sequences totalling 130 bp (1 bp to 46 
bp for each sequence) and 13 overlapping sequences totalling 66 bp (1 bp to 35 bp for each sequence) , 
interspersed throughout the genome, and the largest (46 bp) spacer region and overlapping region are 
located between the tRNA^" and ND2, and between COII and tRNA™" genes, respectively. The large and 
small rRNA genes are 1 337 bp and 773 bp in size, respectively. All the tRNA genes have typical leaf 


A7"^59 whose DHU arm forms a simple loop. The 13 


clover secondary structures, except for the tRN 
protein-coding genes are 11 247 bp in length with corresponding 3 737 codons, their base compositions have 
a relatively higher AT bias and their codon usages are also predominantly A + T-rich. All the protein coding 


genes ( PCGs) use standard initiation codons ATN, except for the COI gene, which uses TTG as its starting 
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codon, and all the PCGs use common stop codon (TAA), except for the COI and ND4 genes, which 


terminate into a single T and TA, respectively. The A + T-rich region is 389 bp in length with the AT 


content up to 92. 0% , and this region contains two microsatellite-like repeating sequences ( TA), and 


( AAT),. The results of this study provide some important molecular data to clarify the systematical status of 


Calinaginae, as well as its phylogenetic relationship with other nymphalid subfamilies. 
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repeated sequences 


线粒体 是 真 核 生 物 细 胞 中 的 一 种 具有 半 上 自主 性 
的 胞 质 细 胞 器 ,， 具有 自身 独特 的 遗传 物质 一 线粒体 
DNA ( mtDNA ) 。 线 粒 体 基因 组 与 核 基因 组 相 比 ， 
具有 母系 遗传 , 进化 速率 快 ， 几 乎 不 发 生 重 组 的 特 
点 , 广泛 用 于 生物 类 群 间 的 系统 进化 分 析 、 比 较 和 
功能 基因 组 研究 等 领域 (Ballard and Rand, 2005) 。 

近年 来 ， 随 着 PCR 以 及 LPCR 技术 的 迅速 发 
Fe, 线粒体 基因 组 全 序列 不 断 地 被 测 出 ,其 已 成 为 
研究 不 同 动物 类 群 的 起 源 、 进 化 、 系 统 发 育 及 群体 
遗传 学 的 理想 材料 。 根 据 NCBI 基因 组 数据 库 
http://www. nebi. nlm. nih.  gov/genomes/ 
ORGANELLES 的 统计 , 截至 2010 年 10 A, 已 测 出 
线粒体 基因 组 全 序列 〈 或 接近 全 序列 ) 的 后 生动 物 
PAA 2 080 种 ,其 中 昆虫 210 Ph, BE H 
(Lepidoptera) 25 Pp, KUE ESL 9 种 。 

WWE; ( Nymphalidae ) 是 蝶 类 中 已 知 物种 最 多 
的 1 个 科 , 计 有 12 个 亚 科 、600 多 个 属 、 约 7 200 
余 种 ,分 布 于 十 北 区 、 东 洋 区 、 新 热 市 区 及 澳洲 区 
等 区 域 ( Wahlberg et al., 2003; Freitas and Brown, 
2004), H JZ BOWE [E i PE KORI RE, 很 难 根 
据 形 态 特征 进行 分 类 (Freitas and Brown, 2004 ) ; 
同时 用 于 区 别 峡 蝶 科 和 其 他 蝶 类 所 特有 的 形态 学 衍 
生性 状 也 难以 找到 (De Jong et al., 1996), limi 
科 较 高 级 分 类 阶 元 的 系统 学 研究 一 二 存 有 很 大 争 
Wo ?HERSEXV RI ( Calinaginae ) FE IE IRP HAY 1 P NE 
Fk, RERE Calinaga 1 Ji, 全 世界 已 记载 大 
约 只 有 8 种 ( Wahlberg et al.,，2003 ) ,主要 分 布 于 古 
北 区 及 东洋 区 , 中 国境 内 有 3 种 : RAZR RR Calinaga 
lhatso, KPIR PARERE Calinaga buddha, H Ñ 
RAW EE BIR FERR FAMKE RAAE 
科 间 的 系统 发 生 关 系 一 直 存 在 争议 (Wahlberg et al., 
2003) 。 大 卫 绢 峡 蝶 作为 绢 峡 蝶 亚 科 一 个 代表 性 种 
K, 其 线粒体 基因 组 序列 数据 是 探讨 这 一 问题 的 关 
BERR FEF IL, 本 文 测 定 并 注释 了 大 卫 绢 峡 蝶 的 
线粒体 基因 组 全 序列 数据 , 并 对 其 基因 组 成 和 结构 
特征 进行 了 初步 分 析 ， 以 期 为 峡 蝶 科 的 系统 学 和 分 


类 学 人 研究 提供 新 的 分 子 生物 学 的 证 据 。 
1 材料 与 方法 


1.1 实验 材料 

实验 所 用 大 卫 绢 峡 蝶 标 本 (雌性 ) 于 2009 年 4 
月 采集 于 安徽 省 金 寒 县 的 国家 级 天 马上 自然 保护 区 ， 
标本 采集 后 立即 浸泡 于 无 水 乙醇 中 国定 , 于 实验 室 
-207 的 冰箱 中 保存 备用 。 
1.2 基因 组 DNA 的 提取 和 纯化 

采取 本 实验 室 改 进 的 玻璃 粉 法 提取 和 纯化 基因 
ZH DNA (Hao et al., 2007) 。 
1.3 PCR 扩 增 与 测序 

COI, COI, Cytb, ND1 和 12S rRNA 等 短片 段 
基因 序列 采用 通用 引物 来 扩 增 (Simon et al., 1994; 
Caterino and Sperling, 1999; Simmons and Weller, 
2001 ) 。 上 自行 设计 了 long PCR 引物 和 NDA, ND5 基 
因 片 段 的 引物 ， 具 体 方 法 为 : 根据 PCR 扩 增 所 得 序 
列 和 GenBank 上 已 公布 的 鳞 翅 目 昆 虫 线 粒 体 基因 
组 序列 , 采用 Clustal X 1. 8 软件 (Thompson et al., 
1997) 进行 比 对 , 选取 保守 性 较 高 的 区 域 , 再 利用 
Primer Premier 5.0 软件 设计 。 所 有 引物 丝 由 上 海 生 
工 生 物 工程 技术 服务 有 限 公司 合 成 。 

短片 段 PCR 反应 体系 为 50 pL, 其 中 包括 10 ~ 
30 ng 的 模板 DNA 1 ~2 uL, 10 pmol/L 的 上 下 游 引 
物 各 1.2 uL, 0.2 mmol/L dNTPs 1.0 uL, 1.0 U 的 
Taq 酶 , 10 x Buffer 5 uL, 0.2 ug/uL BSA 5.0 uL, 
25 mmol/L Mg” 7.0 uL, 27K th E ZÆ 50 uL, 
PCR 反应 程序 为 : 94°C 预 变 性 5 min; 以 下 程序 进 
行 35 个 循环 : 94°C 变性 1 min, 45% ~ 60T 退火 
] min, 72 延伸 1~2 min; 最 后 于 72% 延伸 
10 min。Long-PCR 反应 体系 也 为 50 uL, 其 中 包括 
10 ~ 30 ng 的 模板 DNA 1 ~2 pL, 10 x LA PCR 
Bufferll (Mg** Plus) 5 uL, dNTPs (2. 5 mmol/L) 
8 nL,， 上 下 游 引物 各 1.2 uL, 2.5 U BS LA Taq BB 
(TaKaRa Bio, OtsSu, Shiga, Japan) , XXZ&zK Ap E Æ 


5 期 R WF: 大 卫 绢 峡 蝶 线 粒 体 基 因 组 全 序列 测定 和 分 析 557 


50 pL, 整个 反应 置 于 冰 上 操作 。Long-PCR 反应 程 
FRA: SCHE 5 min; 按 下 述 程序 先后 进行 2 次 15 
个 循环 : 95% 变性 50 s, 45 ~ 59% 退火 50 s ~ 1 min, 
68°C RE 2 min 30 s, 其 中 第 2 次 15 个 循环 在 延伸 步 
又 每 循环 均 另 多 加 5 s; 最 后 于 68Y 总 延伸 10 min, 

PCR 产物 用 1.2% 的 琼脂 糖 凝 胶 电 泳 检测 ,经 
3S 柱 离心 式 PCR 产物 小 量 快速 纯化 试剂 盒 (上海 
申 能 博彩 生物 科技 有 限 公 司 ) 纯化 后 , 送 往 上 海 生 
工 生 物 工 程 技 术 服 务 有 限 公 司 进 行 测 序 。 所 用 测序 
仪器 为 ABI-PRISM3730, 
1.4 序列 拼接 、 注 释 和 分 析 

将 测定 的 序列 在 NCBI 网 站 上 BLAST 进行 序列 
同 源 性 比较 , 确认 无 误 后 通过 Clustal X 1.8 软件 和 
BioEdit 7. 0 软件 ( Hall, 1999) 对 测 出 的 序列 进行 
比 对 分 析 、 排 列 校正 ， 人 工 拼接 以 得 到 完整 的 大 卫 
绢 峡 蝶 的 线粒体 基因 组 全 序列 。 和 蛋 昌 质 编码 基因 用 
Sequin 9. 5 软件 和 鳞 翅 目 近 缘 种 进行 比较 定位 ; 
tRNA 基因 用 tRNAScan-SE 1. 21 ( Lowe and Eddy, 
1997; http://lowelab. cse. ucsc. edu/tRNAscan-SE/ ) 
和 RNAstructure 4. 3 软件 (Mathews, 2006) 进行 定 
位 和 二 级 结构 的 预测 。 采 用 MEGA 4. 0 软件 
(Tamura et al., 2007) 分 析 基 因 组 序列 碱 基 组 成 ， 


蛋白 质 基 因 密 码 子 使 用 频率 等 。 
2 结果 


2.1 KEARIRR AAS AH E 

X TH2B BR aR ei AREA B IMIR 23-3 4& 29 15 267 
bp, dE £g #5 37 个 基因 : 13 个 和 蛋白质 编码 基因 
( ATP6, ATP8, COI - II, NDI -6, ND4L, Cytb), 2 
个 rRNA 基因 (rRNA 和 srRNA), 22 个 tRNA X 
Al, 还 包括 一 个 非 编码 的 控制 区 (A + T-rich IX), 
该 基因 组 合 序 列 已 提交 GenBank, 登录 号 为 
HQ658143。 线 粒 体 各 个 基因 的 排列 顺序 、 和 蛋白 质 
编码 基因 的 开放 阅读 框 的 方 回 和 已 报道 的 其 他 蝶 类 
相 一 致 Kim et al., 2006; Hong et al., 2009; Kim et 
al., 2009a; Hu et al., 2010; Kim et al., 2010) , 没有 
BIRSEA FEHR PRA JU S CBAR BERE zk ar AE DS 
组 结构 如 图 1 所 示 。 基 因 组 共 包 含 11 个 基因 间隔 
DX, 总 长 度 为 130 bp, 间隔 长 度 1 ~46 bp, 最 大 的 基 
因 间 隔 出 现在 tRNA”" 和 ND2 这 两 个 基因 之 间 ; 基因 
间 共 存在 13 处 共 66 bp WERK, 重生 区 的 碱 基数 
1 ~35 bp, BC BE XA y T CON 与 tRNAY 基 因 之 
间 ( 表 1)。 大 卫 绢 峡 嵘 的 线粒体 基因 组 长 度 介 于 已 


测定 的 黑 纹 粉 蝶 Artogeia melete (15 140 bp) 和 宽 尾 
JU Papilio maraho (16 094 bp) 之 间 ( 表 2)。 


Calinaga davidis 
Mitochondrial Genome 
15 267 bp 





图 1 KER RAO RABE A ZB 254 
Fig. 1 Circular map of the Calinaga davidis mitochondrial genome 
ATP8, ATP6; ATP 合成 酶 亚 基 8 和 6 Subunits 6 and 8 of the ATPase; 
Cytb: 细胞 色素 b Cytochrome b; COI, COI, COMI: 细胞 色素 氧化 酶 亚 基 
I ~ III Three cytochrome oxidase subunits; NDI -6, ND4L: NADH 脱氧 酶 
亚 基 1 -6 及 4L NADH dehydrogenase components; L1 ; tRNA'^ (€ ; 12, 
tRNA (UD ，S1，tRNASe(ACN ，S2 ，tRNASe (UCN), tRNA 基因 根据 
IUPAC-IUB 用 氨基 酸 的 单字 母 表 示 ; 不 带 下 划 线 的 基因 表示 基因 转录 方 
加 为 顺 时 针 方向 , 带 下 划 线 的 基因 表示 基因 转录 方向 为 逆 时 针 方向 。 
tRNA genes are denoted as one-letter symbol according to the IUPAC-IUB 
single letter amino acid codes. Genes that are not underlined are 
transcribed in a clockwise direction, while the underlined genes are 


transcribed in a counter clockwise direction. 


同 其 他 蝶 类 一 样 , X TLR ik t z ARSE A AK 
苷 酸 组 成 也 具有 AT jwis PE: 整个 基因 组 A + T @& 
量 为 80. 4%, S F Í HR BE Hipparchia autonoe 
(79.1% ) MERIKI Coreana raphaelis (82.7%) 之 
间 , OP E AEREA A + 了 含量 为 78. 8%, 
rRNA 基因 A +T Get 83.8% , srRNA 基因 A + T 
含量 为 85.996 , tRNA 基因 A + T SHH 81.7%, 
控制 区 A +T 含 量 更 是 高 达 92.0% (R2), X HB 
峡 蝶 的 线粒体 基因 组 的 AT-skew 和 GC-skew ( Perna 
and Kocher, 1995) 分 别 为 —0.045 和 -0.200, XK 
明 其 序列 中 有 较 多 的 T 和 C。 而 目前 已 测定 的 其 他 
EAS mtDNA 中 ，AT-skew 介 于 - 0. 047 (SHIRE ) 
和 0.014(〈 菜 粉 蝶 Pieris rapae) 之 间 ( 表 3)。 因 此 ， 
ERR PARIS (A) 的 频率 波动 是 较 小 的 ,其 变 
化 区 间 在 + 上 0.1 之 间 (Kim et al., 2010), 5j AT- 
skew 不 同 的 是 , 在 所 有 已 测定 的 鳞 翅 目的 mtDNA 
中 ，GC-skew 都 为 较 大 的 负 值 , 从 -0.158 (HIKER) 
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基因 


Gene 
tRNAMet 
tRNA! 
tRNA h 

ND2 
tRNA TP 
tRNA 





tRNA Dr 
COI 
tRNA Leu( UUR) 
COII 
tRNA 
tRNA °P 
ATP8 
ATP6 
COIII 
tRNA SP 
ND3 
tRNA4l 
tRNA A 





tRNA A 
tRN ASer(AGN) 
tRNA h 
tRNAPFPe 
ND5 
tRNAHis 
ND4 
ND4L 
tRNA™ 
tRNAP™ 
ND6 
Cytb 
tRN ASer( UCN) 
ND1 
iRNA Leu CUN) 
rRNA 
tRNA Y” 
stRNA 


A +T -rich region 


Jr T] 


Direction 


F 


EO = = = coo uu Won = = = = Nou uo d uu = = m= = = = = = = = = =m =m = = = m 





昆虫 学 报 Acta Entomologica Sinica 


R1 ADAH ye [A ZB ZB pk 


Table 1 Organization of the Calinaga davidis mitochondrial genome 


位 置 
Position 
1 -68 
69 — 133 
131 - 199 
246 —1 259 
1 258 -1 325 
1 318 - 1 384 
1 385 - 1 449 
] 452 -2 982 
2 983 -3 049 
3 051 -3 761 
3 727 -3 797 
3 818 -3 884 
3 885 -4 046 
4 040 -4 717 
4 717 -5 505 
5 508 -3 573 
5 574 -5 927 
5 950 -6 016 
6 017 -6 078 
6 080 -6 145 
6 144 -6 205 
6 234 —6 301 
6 300 -6 365 
6 365 - 8 101 
8 102 -8 166 
8 166 -9 505 
9 505 -9 792 
9 798 —9 861 
9 862 —9 926 
9 929 — 10 459 
10 459 -11 613 
11 614 - 11 679 
11 678 - 12 634 
12 636 - 12 703 
12 704 — 14 040 
14 041 - 14 105 
14 106 - 14 878 
14 879 —15 267 


长 度 (bp) 


Size 
68 
65 
69 

1 014 
68 
67 
65 

1 531 
67 

711 
71 
67 
162 

678 

789 
66 

354 
67 
62 
66 
62 
68 
66 

1 737 
65 

1 340 

288 
64 
65 

531 

1 155 

66 

957 
68 

1 337 

65 

773 

389 


间隔 ” 


Intergenic length 


O N o 


-35 
20 


-2 
28 
-2 


oO oc c 


起 始 密 码 子 


Start codon 


ATT 


ATG 


ATC 
ATG 
ATG 


ATT 


ATT 


ATG 


ATG 


ATT 


ATG 


ATG 
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终止 密码 子 


Stop codon 


TAA 


T-tRNA 


TAA 


TAA 


TAA 


TAA 


TAA 


TAA 


TA-tRNA 


TAA 


TAA 


TAA 


TAA 


* 间隔 一 列 中 ， 正 数 表示 基因 间隔 碱 基 数 , Te de DS] E BS EB. * In the column of intergenic length, the positive number indicates interval 


base pairs between genes, while the negative number indicates the overlapping base pairs between genes. F; 正 回 Forward; R; 反问 Reverse. 
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到 -0. 318 (Jf Ochrogaster lunifer) 不 等 (Liao et 
al., 2010) , ix xe B] TE SEXH H HJ mtDNA 中 , Jud es be 
(C) eA SIR (G) Wa. TESR E Dt 
码 基 因 中 , 由 丁 链 编码 的 9 个 基因 (ND2, ND3, 
ND6, COI, COI, COIL, ATP6, ATP8 和 CytB) 和 
H N 链 编码 的 4 个 基因 (NDI, ND4, NDAL 和 
NDS ) 的 AT-skew 分 别 为 -0.164 和 —0. 159; GC- 
skew 分 别 为 -0.147 和 0.270 ( 表 3)。 这 表明 丁 链 
编码 基因 的 AT jm p| PEBE EON 链 编 码 的 基因 ; 而 
GC 含量 在 J 链 上 是 G<C, 在 N 链 上 是 C>C, H 
这 一 特征 体现 在 所 有 已 测定 的 鳞 计 目的 线粒体 和 蛋 
白质 编码 基因 中 (Kim et al., 2010) , 

2.2 蛋白质 编 码 基 因 (PCGs) 

大 卫 绢 峡 蝶 线 粒 体 基因 组 有 13 个 蛋白质 编码 
AED], 总 长 度 为 11 247 bp, 共有 3 737 个 密码 子 
(ER 2A ik AS Fb), x q 2 H 1 ZL k 8 ER 
Parnassius bremeri 的 (3 734 个 ) 最 为 接近 ( 表 2) 。 

PCGs 最 常用 的 起 始 密 码 子 为 ATG (COL, 
ATP6，COII，ND4，ND4L，Cytb，ND1) ,其 次 是 
ATT (ND2, ND3, ND5, ND6), ATP8 的 起 始 密码 
FA ATC, 而 COI 基因 没有 标准 的 ATN 起 始 密码 。 
除 COI 基因 以 单个 工 残 基 结 尾 , NDA 基因 以 不 完整 
HJ TA 结尾 外 , 其余 11 个 蛋 日 质 编码 基因 的 终止 密 
码 子 都 为 完整 的 TAA ( 表 1)。 这 些 不 完全 的 终止 
密码 子 可 能 通过 mRNA 加 工 过 程 中 的 多 聚 腺 苷 酸 
化 形成 完整 的 终止 密码 子 (Ojala et al., 1980; 
Anderson et al., 1981; 鲁 成 等 , 2002) 。 

PCGs Had a EAN T (45.8% ) >A (33.096) 
>C (10.6%) >G (10.5%), HA+T Se 78. 896 
介 于 仁 眼 蝶 (76.8% ) 和 朝 灰 蝶 (81.5% ) 之 间 。 分 
析 表 明 , 大 卫 绢 峡 蝶 线粒体 基因 的 密码 子 第 三 位 点 
的 AT 含量 (87.8% ) 高 于 第 一 位 点 (77.6% ) 和 第 
二 位 点 (71.196) , 在 已 测定 的 其 他 蝶 类 线粒体 基因 
组 中 也 有 相同 的 情况 。 

利用 MEGA 4. 0 软件 对 大 卫 绢 峡 蝶 线粒体 的 
13 个 蛋白 质 编 码 基 因 的 相对 同 义 密码 子 使 用 频率 
(relative synonymous codon usage，RSCU ) 进行 了 统 
计 。 结 果 显 示 , 所 有 基因 的 密码 子 使 用 都 存在 着 强 
ZU BS a) HE, 其 中 NNU 和 NNA 密码 子 RSCU 基本 
上 都 大 于 1, 表明 第 3 位 点 为 U 和 A 的 密码 子 使 用 
频率 较 高 ,这 种 密码 子 使 用 的 偏向 性 与 蛋白 质 编码 
基因 的 密码 子 第 3 位 点 的 A + T jm el HE (高 达 
87.8% ) 表现 出 正 相 关 性 。 此 外 , 统计 还 显示 TIT 
(Phe), TTA (Leu), ATT (lle), ATA (Met) 和 


AAT (Asn) 是 使 用 频率 最 高 的 5 种 密码 子 , 占 总 数 
的 45.58% 。 这 种 现象 同样 证 明了 和 有 重 日 质 编 码 基 因 
AT 使 用 的 偏向 性 。 
2.3 tRNA 基因 和 TRNA 基因 

利用 tRNAScan-SE 和 RNAstructure 及 人 工 辅 助 
REX X ZR EIE BJ 22 个 tRNA 基因 进行 定位 和 
二 级 结构 的 预测 。 分 析 表 明 22 个 tRNA 基因 长 度 
范围 介 于 62 bp (tRNA, tRNA ) 和 71 bp 
(IRNA”) 之 间 。 其 中 14 个 tRNA 基因 由 J ñE W 
码 , 另外 8 个 由 NN 链 编码 ( 表 1)。 除 tRNA AS 
Sh, 其余 的 tRNA 都 能 形成 典型 的 三 叶 草 结构 。 
tRNA 缺少 二 氧 尿 喀 啶 臂 ( DHU stem), 在 相 
应 的 位 置 上 只 形成 一 个 简单 环 , 这 在 昆虫 中 很 普遍 
(Wolstenholme, 1992), 。 但 也 有 例外 ,， 如 茶 小 卷 叶 
峨 Adoxophyes honmai 的 tRNA ^6? 就 具有 典型 的 
三 叶 草 结构 (Lee et al., 2006) ; YE X TAIRI RA 
体 的 15 个 tRNA 基因 中 发 生 了 25 对 错 配 , 其 中 9 
XE DHU È E, 7 WEARZE E, 4 对 在 
TYC E, 5 对 在 反 义 密 码 子 辟 上 。 主 要 是 GU， 
U. GAU. UM, tRNA 还 存在 C.A 错 配 。 

rRNA 基因 的 位 置 在 昆虫 线粒体 中 是 比较 保守 
Hj. X H. 28 HEX W& Zk AE IK BJ RNA 基因 位 于 
tRNA 基因 和 tRNA“ 基因 之 间 ，srRNA 基 
MEF tRNA’ 基因 和 A +T 富 集 区 之 间 (图 1)。 
IrRNA 和 srRNA 基因 长 度 分 别 为 1337 bp 和 773 
bp, 两 者 长 度 都 分 别 介 于 已 测定 的 其 他 蝶 类 的 
IrRNA 和 srRNA 基因 长 度 之 间 (& 2). rRNA 和 
srRNA 基因 的 A+T 人 含量 分 别 为 83.8% 和 85.9% , 
与 其 他 蝶 类 的 TRNA 和 srRNA 基因 的 A+T 含 量 比 
较 相 近 (2). 
2.4 A + 丰富 区 

X H zB RE mtDNA 的 A+T 丰 富 区 位 于 
stRNA 基因 与 让 NA“ 基 因 之 间 (图 1) ; 全 长 为 389 
bp, pF SES ye Argyreus hyperbius (349 bp) 与 宽 
Fe RW (1258 bp) 之 间 ; A € T @& 29 92.096 , $ 
于 线粒体 基因 组 任何 区 域 的 A+T 含 量 (2). IE 
区 不 编码 蛋白 质 , 主要 是 对 基因 的 转录 和 复制 起 着 
调控 作用 , 因此 又 称 为 控制 区 。 与 其 他 鳞 翅 上 日 昆 忠 
控制 区 一 样 , 大 卫 绢 峡 蝶 线粒体 的 控制 区 (图 2) 也 
不 含有 明显 的 大 片段 重复 结构 , [HEB srRNA 基因 5 
Fig HY E3$ 21 bp Mb, 有 1 个 “ATAGA” 的 标志 序列 ， 
其 后 紧 跟 19 bp 的 poly (T) 结构 ; HB srRNA 基因 5" 
端的 上 游 56 bp 和 225 bp 处 , 分 别 有 一 段 类 似 微 卫 
星 的 重复 序列 (AAT), 和 (TA)。6; 在 邻近 tRNA “ 
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的 5 g, 还 有 1 个 9 bp 的 poly (A) 结构 。 在 类 似 
微 卫星 的 重复 序列 (TA )6 前 面 有 你 守 的 特征 序列 
“ATTTA”, KPAI mtDNA 控制 区 除了 有 2 Be 


srRNA--14.879 TTATTTAGTGTATTTITATA 





类 似 微 卫 星 的 重复 序列 CAAT) A (TA) 2F, 还 有 
1 段 17 bp 的 两 个 找 贝 ， 只 是 在 第 一 个 找 贝 中 缺失 
了 1 个 G (图 2)。 


ATTATATTAATAATAATAA 





The origin of minority strand replication — Microsatellite-like (AAT), element 


TACTTCTTCCCTATTTTTTTCATAATAT TTATTTTAAAAATTAATATTGTAGTTTATTTAAAAATTCAGTTAAATAATAAAATATTAT 


TAAATTIATTATTIAATTTAGGAAAAAATTTAATAATATTTAAACATTTATATTI 








LATTTATATCAGTATTAAT 


Microsatellite-like (TA), element 


CUA ALALAATTTTTTTAAAAAGCTATTTTTITTACCTTAAATAAACAGGTAAATTTTTATTTTIAATT 


17 bp repeat element 


AATTTTTAASACCATTTTTAATAAATATTCCAATAAA 





[TTA 15,267--tRNAM# 


Poly-T element (in the J strand) 


图 2 KARR A ASE A ZH Ei DX SEA] Fi 


Fig. 2 The structure of the control region of the Calinaga davidis mitogenome 


3 讨论 


3.1 基因 间隔 区 和 重 登 区 

大 卫 绢 峡 蝶 线粒体 基因 组 中 有 11 个 基因 间隔 
K, 其 中 4 个 较 大 的 区 域 分 别 是 在 tRNA^" ND2 
(46 bp), tRNA'^ 5 tRNA“* (20 bp), ND3 5 
tRNA^^(22 bp), tRNA? (^99 Ej IRNA (28 bp) 之 
间 ， 占 整个 间隔 区 全 长 的 89.23% (3€ 1). tRNA™ 
与 ND2 基因 之 间 的 间隔 区 ,在 已 测定 的 蝶 类 
mtDNA 中 都 存在 , 长 度 从 40 bp (ARAR) 到 87 
bp (KIKER Sasakia charonda) 不 等 。 这 段 间隔 区 
序列 与 邻近 的 部 分 ND2 基因 序列 具有 较 高 的 同 源 
性 , 有 旦 只 在 鲜 翅 目 昆 虫 中 发 现 。 它 可 能 是 由 ND2 
基因 部 分 序列 复制 所 产生 的 (Kim et al., 2009a; 
Kim et al., 2010) 。tRNA ° Ej tRNA“? 3£ |N zr 33] Jc Hi 
fM BR EE HEBES I 13 bp 和 1 bp, 但 在 其 他 蝶 
类 中 则 都 有 1 bp KH, ND3 与 tRNA RAZE 
既 有 间隔 序列 ， 如 芝麻 珍 蝶 Acraea issoria (4 bp), 
SHJKSE (10 bp); 也 有 重 欠 序列， 如 黑 纹 粉 蝶 (2 
bp), ARAE (1 bp) ; 还 有 紧邻 现象 ,如 仁 眼 蝶 ， 
RH HG MU HE Papilio xuthus ( Feng et al., 2010), 
tRNA Ej tRNA "基因 的 间隔 区 存在 于 已 测定 
H3 Er BESS mtDNA rH, 长 度 从 1 ~43 bp (ARA 
WE) ANSE, AERA KK rB, 两 基因 之 间 还 有 1 个 
tRNA 基因 (Kim et al., 2006) 。 

K B2B ae eB pd NH RRA 13 处 基因 重 
E. He ATP8 5 ATP6 HA HST 7 bp 
(ATGATAA) , 这 段 7 bp 重叠 序 列 在 已 测定 的 所 有 


蝶 类 中 都 存在 ， 甚 至 在 整个 鳞 茵 目 中 都 很 稼 见 
(Jiang et al., 2009; Kim et al., 2010), K PZB ge 
ATP8 基因 的 3" 端 能 预测 到 1 个 发 卡 结构 ,这 种 现 
Ga TES] IKE (Kim et al., 2006), BA Caligula 
boisduvalii ( Hong et al., 2008 ) FHINE KAR Manduca 
sexta (Cameron and Whiting, 2008) 中 也 有 所 报道 。 
Clary 和 Wolstenholme (1985) 以 及 Boore 和 Brown 
(1994) 都 认为 这 种 发 卡 结构 有 助 于 将 二 者 准确 分 
开 。 这 种 发 卡 结构 很 可 能 是 mRNA 加 工 过 程 中 核 
酸 内 切 酶 的 作用 位 点 ， 有 助 于 将 各 基因 释放 出 的 成 
Zi mRNA 准确 切 开 (Kim et al., 2006; Fenn et al., 
2007 ) 。 
3.2 COI 基因 的 起 始 密 码 子 

大 卫 绢 峡 蝶 线 粒 体 基因 组 中 , 在 COI 基因 起 始 
区 及 紧邻 前 面 tRNA ”基因 的 区 域 都 没有 发 现 标准 
的 ATN ERRET, 这 种 现象 出 现在 所 有 已 测定 
的 蝶 类 线粒体 基因 组 全 序列 中 (图 2)。 而 且 , COI 
基因 起 始 密码 子 的 不 确定 性 及 非典 型 性 在 包括 鳝 
运 目 在 内 的 其 他 市 股 动 物 中 也 是 普遍 存在 的 ( Woo 
et al., 2007; Kim et al.，2009a)。 到 目前 为 止 , 已 
报道 的 钱 翅 目 线 粒 体 基因 组 全 序列 (或 接近 全 序 
列 ) 中 ,COI 基因 的 起 始 密码 子 被 推定 为 三 核 苷 酸 
CGA 的 有 9 种 , SIX ZR NS (Lee et al., 
2006) , 烟草 天 蛾 (Cameron and Whiting, 2008) , #+ 
i (Salvato et al., 2008) , zl Eriogyna pyretorum 
( Jiang et al., 2009) , 3& NE Phthonandria atrilineata 
(Yang et al., 2009), Æ EJ A Bë Hyphantria cunea 
( Liao et al., 2010) , 黑 纹 粉 蝶 (Hong et al., 2009) , 
红 珠 绢 蝶 (Kim et al., 20093) 和 仁 眼 蝶 (Kim et al., 
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2010) ; 被 推定 为 四 核 车 酸 TTAG 的 有 5 种 , 分 别 为 
HY 38 4 Bombyx mandarina, 2 Æ Bombyx mori 
( Yukuhiro et al., 2002) , fE#* Antheraea pernyi ( Liu 
et al., 2008) , K# A. yamamai ( Kim et al., 2009b) 
JJ JK EK (Kim et al., 2006) ; 被 推定 为 六 核 车 酸 
TATTAG 的 有 欧洲 玉米 量 Ostrinia nubilalis 和 亚洲 
ROK HR O. furnacalis ( Coates et al., 2005) 以 及 
ATTACG BY ATH TR RUE (Feng et al., 2010), ILA, 
Ze m (Hong et al., 2008) 和 蕊 麻 珍 蝶 (Hu et al., 
2010) 的 COIL 基因 的 起 始 密码 子 均 被 认为 是 TTG, 
ATR DA RANA HAIE RS CO 基因 
起 始 区 附近 的 序列 进行 了 比 对 , 结果 如 图 3 所 示 。 
在 此 , 我 们 认为 将 TTG AREA Be CO 基因 
的 起 始 密码 子 也 是 可 行 的 。 
3.3 A+T 富 集 区 

鲜 翅 目 昆 虫 线粒体 基因 组 的 控制 区 结构 比 大 
多 数 其 他 昆虫 保守 。 其 控制 区 主要 包括 5 T EM 
别 的 共同 结构 : 轻 链 复制 起 点 〈origin of minority 
strand replication, ON ); poly-T ( poly-thymidine 
stretch) 结构 ; 高 度 变 异 区 ; 类 似 微 卫星 的 重复 序 
列 以 及 靠近 tRNA “上游 的 一 段 poly-T 结构 
(Cameron and Whiting, 2008), ZÆ By O, 位 于 其 





oe bod 





Pieris rapae 
Hipparchia autonoe 
Acraea issoria 


Sasakia charonda 


Calinaga davidis 
Artogeia melete 
Argyreus hyperbius 
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Papilio maraho 
Teinopaipus aureus 
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GCCTATATTICAGCCATITTATE: 


控制 区 3 9: — Et poly-T 结构 的 下 游 , Hix Be poly-T 
结构 被 认为 是 mtDNA 轻 链 复制 起 点 的 识别 位 点 
(Saito et al., 2005) ; TEX TAIE mtDNA 控制 区 
的 3 " 诡 也 发 现 了 有 段 19 bp 的 poly-T 结构 (图 3). 
这 段 poly-T 结构 在 所 有 已 测定 的 鳞 功 目 昆 虫 
mtDNA 中 都 很 保守 , KEM 12 bp CE FÉ UR) 到 
22 bp (HRA) ASF (Kim et al., 2010), Jk2F, 2 
邻 这 段 poly-T 结构 下 游 的 是 另外 一 段 保守 的 模块 
ATAGA, 它 同 样 存 在 于 包括 大 卫 绢 峡 蝶 在 内 的 所 
^H Bl ze B5 8339 HER mtDNA 控制 区 中 。 这 上 段 序 
列 也 被 认为 同 poly-T 结构 一 起 对 mtDNA 轻 链 复制 
起 到 调节 作用 (Kim et al., 2009a)。 

BEA F| EE mtDNA 控制 区 中 类 似 微 卫星 的 重 
复 序 列 通常 位 于 控制 区 中 间 部 分 , 其 前 面 有 有 段 保守 
的 标志 序列 “ATTTA”( Cameron and Whiting, 2008 ; 
Salvato et al., 2008; Kim et al., 2009a), K BZA ke 
WEY ATTTACTA),, 朝 灰 蝶 为 ATTTA( AT)，， 红 珠 
绢 蝶 为 AITITA(AT)。， 黑 纹 粉 蝶 为 ATTTA(AT)i。 
这 一 特征 性 结构 以 及 前 述 的 2 个 17 bp 的 重复 序 
列 、tRNA “5' 端 的 1 个 9 bp 的 poly (A) 序列 有 何 
具体 功能 , 目前 还 不 是 很 清楚 。 





tRNA COI— 
CTIATATCTCAGCCATITEATE CGA AAATGACTT RKWL 


RKWL 
RKWL 
II RKWL 
AAGÍCGA AAA TGATTA RKWL 
AAGÍCGA AAA TGATTA RKWL 
REWL 
REWL 
REWL 
RKWL 
REWL 


REWF 


WE NAM 





KGAAAATGACTT RKWL 


图 3 13 种 已 测定 的 蝶 类 线粒体 COL 基因 起 始 区 前 后 序列 比 对 图 
Fig. 3 Multiple alignment of the COI initiation site sequences of 13 completely (or nearly completely) sequenced butterfly mitogenomes 
标 有 星 号 的 物种 是 接近 测定 全 序列 的 , 没有 标 星 号 的 物种 是 测定 出 了 全 序列 的 ; CO 基因 开始 的 4 个 密码 子 及 所 代表 的 氨基 酸 显示 在 图 的 右 
边 ; 带 有 下 划 线 的 核 苷 酸 是 邻近 的 tRNA 7 基因 的 部 分 序列 。 箭 头 表示 基因 的 转录 方向 。 阴 影 框 内 的 核 苷 酸 表示 相应 物种 当前 所 假定 的 COI 
基因 的 起 始 密码 子 ; 长 形 框 内 密码 子 CGA 存在 于 所 有 已 测定 的 鳞 翅 目 昆 虫 中 ; 虚线 框 显 示 的 是 tRNA 7 基因 内 符合 读 框 的 2 ~3 个 典型 的 起 


台 密 码 子 。Asterisk on the species name indicates the nearly complete sequenced mitogenome, whereas no asterisk indicates completely sequenced 


mitogenomes. The first four codons and their amino acids are provided on the right-hand side of this figure. Underlined nucleotides indicate the adjacent 


partial sequence of tRNA‘. Arrows indicate the transcriptional direction. The shade-boxed nucleotides indicate the currently presumed initiation codon 


for the COI gene. The rectangular boxes indicate the codon CCA found in all sequenced lepidopteran insect species. Dotted boxes indicate the two or three 


in-frame typical start codons that are detected within tRNA T genes. 
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